Model Selection

Multi-source data pre-training

# Multi-source data pre-training

Minueza 32M Base

Minueza-32M-Base is a base model with 32 million parameters, fully trained on extensive English text corpora, suitable for text generation tasks.

Large Language Model

Transformers English

Arabic T5 Small

Arabic language model trained on T5v1.1 small architecture, incorporating multiple Arabic datasets for training

Large Language Model Arabic

RoBERTa model pre-trained on massive Hindi data, supporting masked language modeling tasks

Large Language Model

Convbert Base Generator Finnish

A Finnish ConvBERT generator model pre-trained with Replaced Token Detection (RTD) objective, specialized for fill-mask tasks.

Large Language Model

Transformers Other

Gpt2 Medium Finnish

A 345 million parameter GPT-2 model pre-trained on massive Finnish text, excelling in Finnish text generation

Large Language Model Other

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase